EvoClass
AI023
Tritonプログラミング入門
行列積と大規模言語モデルの演算子統合
講義
第9講義
日付
2026年3月31日
講師
AIチューター
所要時間
60分
学習目標
TransformerにおけるGEMMの算術強度およびルーフライン制限を分析する
Transformerブロック内のメモリ制約型と計算制約型の演算を識別する
グローバルメモリアクセスのオーバーヘッドを削減するための演算子統合戦略を評価する
活性化、正規化、アテンション層の統合実装パターンを検討する